颠覆!华为要做这件大事!50万台PC计算力装进AI大脑

导读:想象一下,当AI大脑装进50万台PC的计算力,会有多厉害?

这样的AI大脑,能做到的不仅仅是能够仰望星空,还能够支撑AI领域诸如计算机视觉、自然语言、自动驾驶、智慧交通、智慧医疗等各类基础性研究与探索。

而这,已经成为了现实。

人类的AI触角已经抵达星空。

当我们想要观测星体时,以前天文学家需要169天才能完成一次对南半球星空中大约20多万颗星体的定位和识别;

而现在,只需10秒,背后的秘密则是深度学习方法训练AI模型,和Atlas 900 AI集群的AI强劲算力。



图 / 图虫

这样的超级计算装置已经落地深圳,被命名为鹏城云脑。它是鹏城实验室建设的人工智能领域信息类的重大科技设施,是探索人工智能奥秘和打造人工智能先进技术的基础性的研究平台。

如今,云脑还在不断地进化着。11月29日,鹏城实验室与华为在深圳共同发布鹏城云脑Ⅱ一期项目,正式开启千P级AI集群应用。而鹏城实验室是广东省启动建设的首批4家省实验室之一,主攻方向与人工智能紧密相关,研究重点包括网络通信、先进计算、网络安全等。

鹏城云脑II也不仅仅能够仰望星空。

如果把它看做是AI大脑,那么基于昇腾AI处理器的华为Atlas 900集群就是AI算力发动机,可以让鹏城云脑II具备相当于50万台高端PC的计算能力。

这些能力还能够支撑AI领域诸如计算机视觉、自然语言、自动驾驶、智慧交通、智慧医疗等各类基础性研究与探索。

当AI大脑装进50万台PC的计算能力

究竟会有多厉害?



图 / 图虫

众所周知,随着大数据洪流式的爆发,数字化、智能化时代正在到来。数据分析处理自然离不开计算能力,而计算力作为重要的生产力,也在随着时代进化。

从1946年第一台计算机诞生,70多年以来,从大型机到个人计算机,从台式机到笔记本、到平板电脑,从智能手机到可穿戴设备,计算设备体积越来越小,功能越来越强,离人的距离也越来越近。

或者说,计算能力已经成为人的能力的一种延伸,计算模式不断演进,伴随着人工智能的发展,计算也将进入智能时代。

未来计算将无处不在,而目前产业界算力供给却是稀缺,这也是华为等科技公司在计算底层能力上创新和投入的大背景。在今年9月,华为就发布了计算产业战略,在架构创新、处理器、商业策略、开放生态等四个方面发力。

而鹏城云脑II正是华为支持的典型的AI计算顶级选手。

那么,云脑的超级计算能力究竟有多强?

鹏城云脑目前算力为100P FLOPS,明年将迈入千P级算力规模,这样的算力规模需要依靠华为Atlas 900集群。

华为Cloud&AI产品与服务总裁侯金龙表示:

“Atlas 900是当前行业领先的AI训练集群,能为各行各业提供充足的AI算力,打破算力垄断。该集群基于数千颗华为自研的昇腾910 AI处理器,相当于50万台PC的计算能力。”



华为高级副总裁、Cloud & AI产品与服务总裁侯金龙(左)与鹏城实验室主任高文(右)出席鹏城云脑Ⅱ发布会

据悉,当今业内顶尖的AI集群一般还停留在百P级FLOPS的水平,也就是每秒十亿一次的计算能力,但随着算法和需求的不断发展,将来必将扩展到千P级FLOPS,(1 EFlops,每秒钟可执行 1018 次浮点计算 )也就是每秒百亿亿次计算能力。

这也意味着,随着AI和计算的结合,未来计算产业将扬帆起航,能够为更多科研和创新提供服务。

比如天文探索、石油勘探等领域,都需要进行庞大的数据计算和处理,原先需要花费好几个月的工作,现在基于云脑的计算,几秒钟就可以完成。

在中国工程院院士、鹏城实验室主任高文看来:“随着人工智能起来以后,计算已经被分叉了,一方面超算仍然有一部分计算机是需要追求解方程的速度;另一方面,人工智能发展后,大量的数据包括图像、视频被收集,然后训练出模型,AI计算更多地在做矩阵、张量运算。比如,现在药物筛选大多都是通过一个生物芯片把图像拍下来以后去筛选结果,但是通过AI机器筛选,处理效率会更高。”

华为欲做AI世界的水和电



图 / 图虫

再往底层看,云脑、Atlas 900的性能其实是基于芯片层:通用计算引擎—鲲鹏,AI计算引擎—昇腾。

围绕着鲲鹏处理器和昇腾AI处理器,华为正在打造新的IT基础设施。

换言之,华为欲成为AI智能世界的水和电。

“未来的计算,特别是大数据和人工智能到了以后,它一定是一个异构的计算,正好对应华为的鲲鹏和昇腾双引擎。其中,鲲鹏920相当于X86的芯片,性能比X86最高性能高30%,功耗低30%。”侯金龙表示:

“过去我们接触的数字世界是建立在英特尔、英伟达、微软这些公司上,华为希望提供第二种选择。”

一方面,在互联网时代,国内企业被国外巨头卡脖子的事件频现,在未来的人工智能时代,国内的巨头们都在提前布局,从芯片、架构到下一代操作系统,大家都在有基因的领域摩拳擦掌。

另一方面,AI计算具有战略意义。AI+5G+云将帮助使各个行业进入智能时代。事实上,目前除了鹏城实验室云脑项目以外,华为在金融、智慧城市、电力、交通、互联网、运营商等各个行业前行,例如南方电网智能巡检系统也是采用了基于昇腾的Atlas产品。

具体来看,华为AI集群Atlas 900汇聚了华为十余年的技术沉淀,由数千颗昇腾910 AI处理器组成。在衡量AI计算能力的标准ResNet-50测试下,Atlas 900只需59.8秒就完成了训练,在同等精度下比原世界纪录快10秒。



图 / 图虫

Atlas 900具有三大创新特性:

其一是强劲算力:数千颗昇腾910 AI处理器互联,半精度(FP16)算力达256-1024 PFLOPS;采用SoC设计,整合了AI算力、通用算力和I/O,有效提升训练效率。

其二是高速集群网络:采用HCCS、PCIe 4.0、100G以太三类高速互联方式,梯度同步时延缩短10%~70%;独创iLossless 智能无损交换算法,对全网流量进行实时的学习训练,实现网络零丢包与端到端微秒级时延。

其三是高效散热:采用柜级绝热密闭系统,液冷占比可大于95%,系统能效比小于1.1。

截至目前,基于昇腾910和310 AI处理器,华为推出了Atlas 900 AI集群、Atlas 800 AI服务器、Atlas 500 智能小站、Atlas 300 AI加速卡和Atlas 200 AI加速模块,完成了Atlas全系列产品布局,覆盖云、边、端全场景,面向训练和推理提供强劲算力。

未来,华为将面向计算产业,持续加大在处理器、操作系统、数据库等基础设施上的投入与创新,为鹏城云脑II提供源源不断的AI算力,携手鹏城实验室共同促进AI技术的进一步发展以及在社会经济各领域的广泛应用与实践。

推荐阅读